FILTER MODE ACTIVE

#оптимизация моделей

Найдено записей: 4

#оптимизация моделей27.06.2025

Polaris-4B и Polaris-7B: масштабируемое обучение с подкреплением для продвинутого математического и логического рассуждения

Polaris-4B и Polaris-7B представляют новый рецепт обучения с подкреплением, который эффективно масштабирует способности к рассуждению, достигая передовых результатов в математических тестах с использованием небольших моделей.

#оптимизация моделей16.06.2025

MiniCPM4 от OpenBMB: революция в edge AI с ультраэффективными языковыми моделями

OpenBMB представила MiniCPM4 — ультраэффективные большие языковые модели, оптимизированные для edge-устройств, с разреженным вниманием и быстрым инференсом, превосходящие конкурентов при меньшем объёме данных.

#оптимизация моделей11.05.2025

Введение Effective State-Size (ESS): Новый Метрик для Измерения Использования Памяти в Последовательных Моделях

Исследователи представили Effective State-Size (ESS) — новую метрику для измерения реального использования памяти в последовательных моделях, что улучшает оценку и оптимизацию их работы.

#оптимизация моделей27.04.2025

ByteDance представляет QuaDMix: революция в предобучении больших языковых моделей с оптимизацией качества и разнообразия данных

ByteDance анонсировала QuaDMix — систему, которая улучшает предобучение больших языковых моделей за счёт совместной оптимизации качества и разнообразия данных, обеспечивая значительный прирост производительности.